Stable Diffusion

Stable Diffusion
VývojářStability AI
První vydání22. srpna 2022
Aktuální verzeSDXL 1.0 (model)[1]
Operační systémVšechny, které podporují jádra CUDA
Vyvíjeno vPython
LicenceCreative ML OpenRAIL-M
Webstability.ai
Některá data mohou pocházet z datové položky.

Stable Diffusion je model hlubokého učení převádějící text na obraz, který byl uveden na trh v roce 2022 na základě techniky difúze. Je primárně určen k generování podrobných obrázků na základě popisů textu, ale lze jej také použít k dalším úkolům, jako je inpainting, outpainting a generování překladů obrazu k textovému zadání. Byl vyvinut výzkumníky z CompVis Group na Ludwig Maximilian University v Mnichově a Runway s výpočetním příspěvkem od Stability AI a trénovacími daty poskytnutými neziskovými organizacemi.[2][3][4]

Stable Diffusion, vývojový krok v oblasti generativního umělého modelování, reprezentuje latentní difúzní model postavený na hluboké neuronové síti. Tento inovativní model byl navržen s důrazem na otevřený zdrojový kód[5], umožňující komunitě vývojářů přístup k jeho váhám kódu a modelu. Co ještě fascinující, je jeho schopnost provozu na široké škále spotřebního hardwaru, přičemž minimální požadavek je grafická karta s alespoň 4 GB VRAM (virtuální paměti).

Odklon od předchozích proprietárních modelů, jako jsou DALL-E a Midjourney, je patrný v tom, že Stable Diffusion nabízí možnost využívat jej na lokálním hardwaru bez nutnosti spoléhat se na cloudové služby. Tímto způsobem se dále posiluje nezávislost uživatelů a umožňuje větší flexibilitu při využívání této pokročilé technologie.[6]

  1. Announcing SDXL 1.0 [online]. Dostupné v archivu pořízeném z originálu dne July 26, 2023. 
  2. Leaked deck raises questions over Stability AI's Series A pitch to investors [online]. [cit. 2023-06-20]. Dostupné v archivu pořízeném z originálu dne June 29, 2023. 
  3. Revolutionizing image generation by AI: Turning text into images [online]. [cit. 2023-06-21]. Dostupné v archivu pořízeném z originálu dne September 17, 2022. 
  4. MOSTAQUE, Emad. Stable Diffusion came from the Machine Vision & Learning research group (CompVis) @LMU_Muenchen [online]. November 2, 2022 [cit. 2023-06-22]. Dostupné v archivu pořízeném z originálu dne July 20, 2023. (anglicky) 
  5. Stable Diffusion Repository on GitHub [online]. CompVis - Machine Vision and Learning Research Group, LMU Munich, 17 September 2022 [cit. 2022-09-17]. Dostupné v archivu pořízeném z originálu dne January 18, 2023. 
  6. The new killer app: Creating AI art will absolutely crush your PC [online]. [cit. 2022-08-31]. Dostupné v archivu pořízeném z originálu dne 2022-08-31. 

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne